휴먼 플레이 데이터를 활용한 메모리 기반 모방학습

홈 > 연구문헌 > 학술대회 프로시딩 > 한국정보과학회 학술대회 > KSC 2018

한글제목(Korean Title)	휴먼 플레이 데이터를 활용한 메모리 기반 모방학습
영문제목(English Title)	Memory-based Imitation learning using Human-play data
저자(Author)	민병준 김경중 Byeongjun Min KyungJoong Kim
원문수록처(Citation)	VOL 45 NO. 02 PP. 0734 ~ 0736 (2018. 12)
한글내용 (Korean Abstract)	최근 강화학습은 복잡한 의사결정 문제에서 좋은 성과들을 달성하고 있으며, 신경망과 강화학습을 결합한 Deep Q Network(DQN), Asynchronous Actor-Critic Agents(A3C) 와 같은 모델들이 많이 사용되고 있다. 하지만 신경망 기반 모델들은 Stochastic Gradient Descent(SGD) 의 느린 업데이트 속도로 인해 학습에 매우 오랜 시간이 소모된다. 또한 강화학습에서는 에이전트가 스스로 학습에 필요한 샘플 데이터를 수집하기 때문에, 에이전트는 매우 오랜 시간동안 환경과의 상호작용을 한다. 본 논문에서는 이러한 느린 학습속도를 개선하기 위한 메모리 기반 학습방법 Episodic Control From Demonstration(ECFD)을 제안하여 휴먼 플레이 데이터셋을 활용한 모방학습을 진행한다. 실험은 Atari 환경에서 진행하였고, 기존 모델들과 비교해 좋은 성능을 보였다.
영문내용 (English Abstract)
키워드(Keyword)
파일첨부	PDF 다운로드